En esta hoja de trabajo se generaran dos modelos de redes neuronales que sean capaces de clasificar usando la variable de respuesta que categoriza las casas en baratas, medias y caras. Estos modelos tendran diferentes topologias y funciones de activacion. Estos modelos se utilizaran para predecir la variable de respuesta. Asimismo, se realizaran las matrices de confucion y se compararan los resultados. Seguido de esto, se realizara el mismo proceso pero para la variable SalesPrice, de manera que el algoritmo prediga el precio de las casas.
A continuacion se muestra el modelo generado con caret:
## Neural Network
##
## 1005 samples
## 36 predictor
##
## Pre-processing: scaled (36), centered (36)
## Resampling: Bootstrapped (25 reps)
## Summary of sample sizes: 1005, 1005, 1005, 1005, 1005, 1005, ...
## Resampling results across tuning parameters:
##
## size decay RMSE Rsquared MAE
## 1 0e+00 0.3907485 0.7622808 0.2769931
## 1 1e-04 0.3918450 0.7612514 0.2753927
## 1 1e-01 0.3783910 0.7779488 0.2669289
## 3 0e+00 0.4639380 0.6845588 0.2627924
## 3 1e-04 0.4538665 0.6977134 0.2652302
## 3 1e-01 0.4119560 0.7432752 0.2643202
## 5 0e+00 0.5618630 0.6099531 0.3083380
## 5 1e-04 0.5727794 0.6095714 0.3217542
## 5 1e-01 0.4391807 0.7175722 0.2927027
##
## RMSE was used to select the optimal model using the smallest value.
## The final values used for the model were size = 1 and decay = 0.1.
Seguido de esto vemos la prediccion y su matriz de confusion:
## Confusion Matrix and Statistics
##
##
## 3 2 1
## 3 107 12 0
## 2 16 114 9
## 1 0 24 149
##
## Overall Statistics
##
## Accuracy : 0.8585
## 95% CI : (0.8219, 0.89)
## No Information Rate : 0.3666
## P-Value [Acc > NIR] : < 2.2e-16
##
## Kappa : 0.7861
##
## Mcnemar's Test P-Value : NA
##
## Statistics by Class:
##
## Class: 3 Class: 2 Class: 1
## Sensitivity 0.8699 0.7600 0.9430
## Specificity 0.9610 0.9110 0.9121
## Pos Pred Value 0.8992 0.8201 0.8613
## Neg Pred Value 0.9487 0.8767 0.9651
## Prevalence 0.2854 0.3480 0.3666
## Detection Rate 0.2483 0.2645 0.3457
## Detection Prevalence 0.2761 0.3225 0.4014
## Balanced Accuracy 0.9155 0.8355 0.9276
A continuacion se muestra el modelo generado con NNet:
## # weights: 951
## initial value 5031.726971
## iter 10 value 637.344651
## iter 20 value 418.319770
## iter 30 value 380.523953
## iter 40 value 359.563226
## iter 50 value 353.961363
## iter 60 value 349.629284
## iter 70 value 347.159325
## iter 80 value 345.745372
## iter 90 value 344.567672
## iter 100 value 343.870690
## iter 110 value 343.676592
## iter 120 value 341.483413
## iter 130 value 326.198745
## iter 140 value 316.714176
## iter 150 value 310.232274
## iter 160 value 288.008201
## iter 170 value 244.586163
## iter 180 value 230.158380
## iter 190 value 222.209036
## iter 200 value 216.589345
## iter 210 value 213.145943
## iter 220 value 201.923250
## iter 230 value 158.295899
## iter 240 value 126.279922
## iter 250 value 117.794434
## iter 260 value 117.527846
## iter 270 value 117.525356
## iter 280 value 117.494324
## iter 290 value 117.490541
## iter 300 value 117.489091
## final value 117.489091
## stopped after 300 iterations
Seguido de esto vemos la prediccion y su matriz de confusion:
## Confusion Matrix and Statistics
##
##
## 3 2 1
## 3 106 12 0
## 2 17 114 9
## 1 0 24 149
##
## Overall Statistics
##
## Accuracy : 0.8561
## 95% CI : (0.8194, 0.8879)
## No Information Rate : 0.3666
## P-Value [Acc > NIR] : < 2.2e-16
##
## Kappa : 0.7826
##
## Mcnemar's Test P-Value : NA
##
## Statistics by Class:
##
## Class: 3 Class: 2 Class: 1
## Sensitivity 0.8618 0.7600 0.9430
## Specificity 0.9610 0.9075 0.9121
## Pos Pred Value 0.8983 0.8143 0.8613
## Neg Pred Value 0.9457 0.8763 0.9651
## Prevalence 0.2854 0.3480 0.3666
## Detection Rate 0.2459 0.2645 0.3457
## Detection Prevalence 0.2738 0.3248 0.4014
## Balanced Accuracy 0.9114 0.8337 0.9276
Debajo tenemos una grafica comparativa del Accuracy obtenido de los modelos utilizados para las predicciones: